最高のAI Tips AIツールモデル_厳選AI Tips情報

AIニュース

グーグルDeepMindの新研究TIPSv2：AIが画像を本当に理解できるようにする　ただ一瞬見るだけではない

グーグルDeepMindの最新研究は、AIの視覚モデルが全体的には強いが、局所的には弱いという欠点を明らかにし、TIPSv2の解決策を提案しました。この方案は、訓練方法を改良することで、モデルが画像の局所的な詳細をより正確に特定できるようにし、例えばパンダの左後足の位置を識別するなど、視覚-言語モデルにおける細かいセグメンテーションタスクの長期的な課題を解決しました。

23.2k 1 時間前

モデル

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

$3.9

入力トークン/百万

$15.2

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Doubao-1.5-pro-32k

Bytedance

$0.8

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Doubao-Seedance-1.0-pro

Bytedance

入力トークン/百万

出力トークン/百万

コンテキスト長

DeepSeek-V3.1

Deepseek

入力トークン/百万

$12

出力トークン/百万

128

コンテキスト長

Hunyuan-T1-latest

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

騰訊混元生ビデオ

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

GPT-5 mini

Openai

$1.75

入力トークン/百万

$14

出力トークン/百万

400

コンテキスト長

Claude Opus 4.1

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

GLM-4.5-Flash

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

GLM-4.5-AirX

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

GLM-4.5-Air

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Spark X1

Iflytek

入力トークン/百万

出力トークン/百万

コンテキスト長

Hunyuan-TurboS-latest

Tencent

$0.8

入力トークン/百万

出力トークン/百万

コンテキスト長

Qwen3-0.6B

Alibaba

$0.3

入力トークン/百万

出力トークン/百万

コンテキスト長

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

グーグルDeepMindの新研究TIPSv2：AIが画像を本当に理解できるようにする ただ一瞬見るだけではない

モデル

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Gemini 2.5 Flash-Lite

qwen3-omni-flash-realtime

qwen3-tts-flash-realtime

Doubao-1.5-pro-32k

Doubao-Seedance-1.0-pro

DeepSeek-V3.1

Hunyuan-T1-latest

騰訊混元生ビデオ

GPT-5 mini

Claude Opus 4.1

GLM-4.5-Flash

GLM-4.5-AirX

GLM-4.5-Air

Spark X1

Hunyuan-TurboS-latest

Qwen3-0.6B

グーグルDeepMindの新研究TIPSv2：AIが画像を本当に理解できるようにする　ただ一瞬見るだけではない